Tableau Desktopからデータへの接続とデータインタープリター ー Tableau Desktop再入門
こんにちは、スズです。
Tableau Desktopは、ドラッグ&ドロップで操作可能なインターフェースでデータの可視化が行えるセルフサービス分析ツールです。
Tableau Desktopの基本的な使い方や機能を改めて紹介していくTableau Desktop再入門シリーズとして、細々と書いていきたいと思います。第一回の本記事では、Tableau Desktopからデータへの接続とデータインタープリターについてご紹介します。
執筆環境
本記事は以下の環境で執筆しています。
- Tableau Desktop 2022.2
- Windows 10 Pro
データへの接続
Tableau Desktopでデータを可視化するために、まずは可視化したいデータに接続します。Tableau Desktopを起動すると、左ペインに[接続]が表示されます。この[接続]からデータに接続します。
接続先は以下の中から選択できます。
- データの検索
- ファイルへ
- サーバーへ
- 保存されたデータソース
データの検索
Tableau ServerまたはTableau Cloudにアクセスし、アクセス先にあるデータソースやテーブルなどから選択してデータに接続します。
ファイル
Excel、CSV、PDFなどのファイルに接続します。
サーバー
Amazon RedshiftやGoogle BigQueryなどのデータウェアハウスや、Box、Salesforceなどに接続できます。[サーバーへ]にある[その他]をクリックすると、接続可能なコネクタの一覧が表示されます。
保存されたデータソース
保存されたデータソースの中から選択して簡単にデータにアクセスできます。初期状態ではTableauが用意しているサンプルデータが表示されています。
保存されたデータソースへの追加
ダッシュボードを作成していく中で頻繁に利用するデータなどがある場合、簡単にアクセスできるように保存されたデータソースに追加することができます。
シートから[データ]ペインにあるデータソースの名前を右クリックし、[保存されたデータソースに追加]からデータソースファイル(.tds)またはパッケージドデータソース(.tdsx)で[マイTableauリポジトリ]配下の[データソース]に保存することで、保存されたデータソースに追加できます。
データインタープリター
Excel、CSV、PDF、Googleスプレッドシートに接続した場合、[データインタープリターの使用]というオプションが表示されることがあります。
データインタープリターは、接続したデータがTableauで解釈できない形式になっていた場合に、Tableauで分析しやすい形式に自動で調整する機能です。Tableauで読み込んだデータの調整を行いますが、接続元のデータには影響ははありません。
ここでは、e-Statの以下のファイルを使ってデータインタープリターを試してみます。
Excelでファイルを開くと以下のようになっています。最初の数行は使用したいデータではなかったり、ヘッダーが複数重なっていたり、このまま使用するのは難しそうですね。
こちらのファイルをTableau Desktopで接続し、データインタープリターを試してみます。
コードの列が数値と認識されているため「a」の値がNullになっていますが、パッと見たところこのままデータを利用することもできそうです。(ちなみに、コードの列を手動で文字列に変更すると「a」の値も表示されました。)
データインタープリターを使用すると結果のレビューを参照できます。結果のレビューでは元のデータに対してTableauがどう解釈したのかを確認できます。以下の画像では、ピンクの部分は列のヘッダー(フィールド名)、緑の部分は値として解釈されています。どの色が何を示しているのかなども結果のレビューの中に解説があります。
Tableauで解釈しやすい形式に自動調整するデータインタープリターですが、以下の条件に合致するデータの場合は使用することはできません。
- データに 2000 を超える列が含まれている。
- データに 3000 を超える行と 150 を超える列が含まれている。
最後に
Tableau Desktopからデータへの接続とデータインタープリターについてご紹介しました。